动态运动原语(DMP)为编码,生成和调整复杂的最终效应轨迹提供了极大的多功能性。 DMP也非常适合从人类演示中学习操纵技巧。但是,DMP的反应性质限制了其用于工具使用和对象操纵任务的适用性,这些任务涉及非全面约束,例如切割手术刀切割或导管转向。在这项工作中,我们通过添加一个耦合项来扩展笛卡尔空间DMP公式,该耦合术语强制执行一组预定义的非独立约束。我们使用udwadia-kalaba方法获得约束强迫项的闭合形式表达式。这种方法提供了一种干净,实用的解决方案,以确保运行时的限制满意度。此外,约束强迫项的提议的分析形式可实现有效的轨迹优化,但受约束。我们通过展示如何从人类示范中学习机器人切割技能来证明这种方法的有用性。
translated by 谷歌翻译
在模拟中测试黑盒感知控制系统面临两个困难。首先,模拟中的感知输入缺乏现实世界传感器输入的保真度。其次,对于合理准确的感知系统,遇到罕见的故障轨迹可能需要进行许多模拟。本文结合了感知误差模型 - 基于传感器的检测系统的替代模型与状态依赖性自适应重要性抽样。这使我们能够有效地评估模拟中现实世界感知控制系统的罕见故障概率。我们使用配备RGB障碍物检测器的自动制动系统进行的实验表明,我们的方法可以使用廉价的模拟来计算准确的故障概率。此外,我们展示了安全指标的选择如何影响能够可靠地采样高概率失败的学习建议分布的过程。
translated by 谷歌翻译
实现安全和强大的自主权是通往更广泛采用自动驾驶汽车技术的道路的关键瓶颈。这激发了超越外在指标,例如脱离接触之间的里程,并呼吁通过设计体现安全的方法。在本文中,我们解决了这一挑战的某些方面,重点是运动计划和预测问题。我们通过描述在自动驾驶堆栈中解决选定的子问题所采取的新方法的描述,在介绍五个之内采用的设计理念的过程中。这包括安全的设计计划,可解释以及可验证的预测以及对感知错误的建模,以在现实自主系统的测试管道中实现有效的SIM到现实和真实的SIM转移。
translated by 谷歌翻译
四倍的机器人通常配备额外的手臂进行操作,对价格和重量产生负面影响。另一方面,腿部运动的要求意味着,这种机器人的腿通常具有执行操作所需的扭矩和精度。在本文中,我们介绍了一种新颖的设计,该设计针对一个小型四倍的机器人,配备了两个受甲壳类动物和指关节walker前的前肢启发的腿部安装机。通过使用腿部已经存在的执行器,我们只能使用每个肢体额外的3个电动机来实现操纵。该设计使相对于腿部电动机的小型且廉价的执行器的使用,从而进一步降低了成本和重量。由于集成的电缆/皮带轮系统,惯性的瞬间对腿的影响很小。正如我们在一套远程操作实验中所显示的那样,机器人能够执行单个和双LIMB操纵,并在操纵模式之间过渡。拟议的设计的性能与额外的手臂相似,同时称重和成本减少了每个操纵器的5倍,并可以完成需要2个操纵器的任务。
translated by 谷歌翻译
随着自主系统成为我们日常生活的一部分,确保其信任度至关重要。有许多用于证明可信赖性的技术。所有这些技术的共同点是需要阐明规格。在本文中,我们对规格进行了广泛的看法,专注于顶级要求,包括但不限于功能,安全性,安全性和其他非功能性属性。本文的主要贡献是对于与指定可信度相关的自主系统社区的一系列高级智力挑战。我们还描述了有关自主系统的许多应用程序域的独特规范挑战。
translated by 谷歌翻译
自动驾驶汽车使用各种传感器和机器学习型号来预测周围道路使用者的行为。文献中的大多数机器学习模型都集中在定量误差指标上,例如均方根误差(RMSE),以学习和报告其模型的功能。对定量误差指标的关注倾向于忽略模型的更重要的行为方面,从而提出了这些模型是否真正预测类似人类行为的问题。因此,我们建议分析机器学习模型的输出,就像我们将在常规行为研究中分析人类数据一样。我们介绍定量指标,以证明在自然主义高速公路驾驶数据集中存在三种不同的行为现象:1)运动学依赖性谁通过合并点首次通过合并点2)巷道上的车道更改,可容纳坡道车辆3 )车辆通过高速公路上的车辆变化,以避免铅车冲突。然后,我们使用相同的指标分析了三个机器学习模型的行为。即使模型的RMSE值有所不同,所有模型都捕获了运动学依赖性的合并行为,但在不同程度上挣扎着捕获更细微的典型礼貌车道变更和高速公路车道的变化行为。此外,车道变化期间的碰撞厌恶分析表明,模型努力捕获人类驾驶的物理方面:在车辆之间留下足够的差距。因此,我们的分析强调了简单的定量指标不足,并且在分析人类驾驶预测的机器学习模型时需要更广泛的行为观点。
translated by 谷歌翻译
医疗机器人技术可以帮助改善和扩大医疗服务的影响力。医疗机器人的一个主要挑战是机器人与患者之间的复杂物理相互作用是必须安全的。这项工作介绍了基于医疗应用中分形阻抗控制(FIC)的最近引入的控制体系结构的初步评估。部署的FIC体系结构在主机和复制机器人之间延迟很强。它可以在接纳和阻抗行为之间在线切换,并且与非结构化环境的互动是强大的。我们的实验分析了三种情况:远程手术,康复和远程超声扫描。实验不需要对机器人调整进行任何调整,这在操作员没有调整控制器所需的工程背景的医疗应用中至关重要。我们的结果表明,可以使用手术刀进行切割机器人,进行超声扫描并进行远程职业治疗。但是,我们的实验还强调了需要更好的机器人实施例,以精确控制3D动态任务中的系统。
translated by 谷歌翻译
在交通场景中的道路使用者的运动预测对于必须在复杂的动态环境中采取安全和强大决策的自动驾驶系统至关重要。我们提出了一种新型的运动预测系统,用于自动驾驶。我们的系统基于贝叶斯逆计划框架,该框架有效地精心策划了基于地图的目标提取,基于经典的基于控制的轨迹发生器以及专家集合轻巧神经网络的混合物,专门针对运动概况预测。与许多替代方法相反,这种模块化有助于隔离性能因素并更好地解释结果,而不会损害性能。该系统解决了感兴趣的多个方面,即多模式,运动概况不确定性和轨迹物理可行性。我们报告了流行的高速公路数据集NGSIM的几个实验,这在轨迹误差方面证明了最先进的性能。我们还对系统组件进行了详细的分析,以及基于行为(例如变更车道与跟随车道)对数据进行分层的实验,以提供对该域中挑战的见解。最后,我们提出了定性分析,以显示我们方法的其他好处,例如解释产出的能力。
translated by 谷歌翻译
软执行器为轻柔的抓握和灵活的操纵等任务提供了一种安全,适应性的方法。但是,由于可变形材料的复杂物理学,创建准确的模型来控制此类系统是具有挑战性的。准确的有限元方法(FEM)模型具有用于闭环使用的过度计算复杂性。使用可区分的模拟器是一种有吸引力的替代方案,但是它们适用于软执行器,可变形材料仍然没有被忽略。本文提出了一个结合两者优势的框架。我们学习了一个由材料属性神经网络和其余操纵任务的分析动力学模型组成的可区分模型。该物理信息模型是使用FEM生成的数据训练的,可用于闭环控制和推理。我们在介电弹性体执行器(DEA)硬币提取任务上评估我们的框架。我们模拟使用DEA使用摩擦接触,使用FEM沿着表面拉动硬币的任务,并评估物理信息模型以进行模拟,控制和推理。与FEM相比,我们的模型达到了<5%的仿真误差,我们将其用作MPC控制器的基础,MPC控制器比无模型的参与者 - 批评者,PD和启发式策略所需的迭代率更少。
translated by 谷歌翻译
We consider a long-term average profit maximizing admission control problem in an M/M/1 queuing system with a known arrival rate but an unknown service rate. With a fixed reward collected upon service completion and a cost per unit of time enforced on customers waiting in the queue, a dispatcher decides upon arrivals whether to admit the arriving customer or not based on the full history of observations of the queue-length of the system. \cite[Econometrica]{Naor} showed that if all the parameters of the model are known, then it is optimal to use a static threshold policy - admit if the queue-length is less than a predetermined threshold and otherwise not. We propose a learning-based dispatching algorithm and characterize its regret with respect to optimal dispatch policies for the full information model of \cite{Naor}. We show that the algorithm achieves an $O(1)$ regret when all optimal thresholds with full information are non-zero, and achieves an $O(\ln^{3+\epsilon}(N))$ regret in the case that an optimal threshold with full information is $0$ (i.e., an optimal policy is to reject all arrivals), where $N$ is the number of arrivals and $\epsilon>0$.
translated by 谷歌翻译